EvoClass
AI012
深入探究大型语言模型
高级推理、知识编辑与数学逻辑
学习目标
- 分析并比较思维链变体:区分自洽性(Self-Consistency)、思维程序(PoT)、思维树(ToT)和思维图(GoT)等架构之间的差异。
- 评估知识编辑技术:理解可靠性、局部性和可移植性等指标,并区分内部编辑(ROME)与外部编辑(SERAC)方案的区别。
- 评估数学逻辑流程:识别用于提升 DeepSeek-Math 和 o1 等模型长文本数学推理能力的训练数据(GSM8K、MATH、AIME)及知识蒸馏流程。